Datos

Buscando en la red encontramos datos relacionados a la “felicidad” en distintos países. Un reporte completo lo puedes encontrar en la pagina de World Happiness Report con los resultados del año 2020 los cuales podemos descargar y analizarlos por nuestra cuenta.

En el reporte podemos ver diferentes mediciones que hacen para determinar la felicidad que tienen los habitantes de cada país como son el expectativa de vida, salud, percepción de la corrupción, calidad democratica etc. Ocupan estas mediciones para comparar a los distintos paises y se observa que uno de los países con mayor calificación de felicidad en su población es Finlandia.

¿Pero com ha cambiado los diferentes paramétros que se han medido en los ultimos años? Para responder esto descargamos los datos que estan presensente en el archivo con el nombre WHR20_DataForTable2-1.csv. Los datos presentan diferentes paramétros que evaluaron y los que estamos interesados son los siguientes:

En estas útimas dos variables se observo que en algunos países no se tenía el valor correspondiente para el año 2019. Hay dos posibles alternativas para este caso. La primera es remover las observaciones del año 2019 pero al hacer esto se perdera la información de este año. La segunda alternativa es imputar los valores faltantes y para hacer esto podemos ocupar los valores del año anterior, 2018, esto con la suposición de que la calidad democratica no es fácil cambiarla en un solo año

Se han tomado registro de los datos desde el año 2005 sin embargo solo un país estaba incluido en el reporte (Canada), pero a partir del año 2006 se incluyeron los más países hasta el año 2019.

En el reporte correspondiente podemos ver gráficas de barras con los valores de las distintas variables. En este set de datos tenemos 12 variables númericas distintas. Dado que no podemos mostrar todas las variables por ser tantas dimensiones podemos aplicar el análisis de componentes principales (PCA).

PCA

Para realizar el PCA tomaremos los datos de 2017 que contienen 128 países los cuales estan distribuidos en los 5 continentes.

Los resultados del PCA son los siguientes:

## Importance of components:
##                           PC1    PC2    PC3     PC4     PC5     PC6    PC7
## Standard deviation     2.4723 1.5066 0.9512 0.81501 0.76023 0.65150 0.5661
## Proportion of Variance 0.5094 0.1892 0.0754 0.05535 0.04816 0.03537 0.0267
## Cumulative Proportion  0.5094 0.6985 0.7739 0.82927 0.87743 0.91280 0.9395
##                            PC8     PC9    PC10    PC11    PC12
## Standard deviation     0.46746 0.43936 0.38209 0.33727 0.23380
## Proportion of Variance 0.01821 0.01609 0.01217 0.00948 0.00456
## Cumulative Proportion  0.95771 0.97380 0.98597 0.99544 1.00000

Los resultados los preparamos para poderlos representar en una visualización usando ggplot2

Entre los aspectos que podemos observar aqui es que destaca la “polarización” entre el continente Africano y el Europeo donde las variables de de ingreso per Capita, calidad democratica y salud son las que más contribuyen a la dispersión de los datos. Los países del continente asíatico presentan un mayor dispersión entre ellos diferenciandose principalmente en la libertad de la toma de decisiones. Mientras que los países del continente Americano parecen tener mismos comportamientos excepto algunos como Canada que se encuentra junto con los países con mejores resultados. El contienente Europeo resulta bastante interesante por que hay un grupo de países con muy buenas “calificaciones” pero también hay un grupo que presenta valores contrarios en los cuales parece contribuir la percepción de la corrupción.

Pero para poder aprovechar más la visualización podemos hacerla interactiva y asi saber cual es cada país.

Dado que se tienen los datos de diferentes años podemos ver como han sido los cambios por ejemplor en el parametro Life Ladder.

Al parecer México iba mejorando pero tuvo una caida drastica a comparación de Finlandia pero esperemos que pueda tener un crecimiento positivo en los siguientes años.

Como podemos ver se puede mucho con los datos pero en un reporte como de este estilo sería muy repetitivo por lo tanto creamos una pequeña app que nos permita explorar lo datos de una manera más dínamica.